Практикум 9. Структурные выравнивания. Связь структуры и функции

Задание 1


В этом задании даны координаты неизвестного белка. Требуется с помощью PDBeFold и других сервисов предположить, что это за белок и описать его.

По результатам структурного поиска в PDBeFold можно смело (100% совпадение последовательности, Z-score находки 19.3) утверждать, что наш белок - липаза А из B. subtilis.
В литературе, оказывается, мучаются тем, что не могут решить, как правильно называть тот или иной белок: липаза или эстераза [ссылка]. Мы на эту тему рассуждать не будем и скажем, что функция липазы А – гидролиз сложных эфиров. Без уточнения каких.

Просмотрев 10 лучших находок PDBeFold, я не нашел ничего, похожего на кофактор. По всей видимости липаза А "самостоятельная" и в них не нуждается.

Что касается активного центра, то в самой похожей структуре по мнению PDBeFold, есть ковалентно связанный ингибитор. Он нам и покажет, где расположен активный центр.

no_alignment_needed.png

Наша структура неизвестного белка (зеленая) и цепь А из 1r50 (голубая). Вторичная структура для обеих структур предсказана DSSP в Pymol. По всей видимости, как раз цепь А 1r50 и использовалась при составлении нашей неизвестной структуры: их наложение не потребовалось. Они уже были в таких координатах, как изображено.
Дальше будем работать с цепью А из 1r50.

site.png

Сайт связывания расположен на поверхности белка. Он сформирован в основном петлями и альфа-спиралями.

site_surf.png

Действительно, на поверхности.

Белок представляет из себя один домен, что облегчает выполнение практикума.
Что касается функции, то на лекциях рассказывалось, что липазы похожи на протеазы, потому как химические реакции не сильно отличаются. Попробую поискать каталитическую триаду и оксианионный центр.

active_site.png

Вот они слева направо: Asp133, His156, Ser77 (каталитическая триада), Met78, Ile12 (оксианионный центр).
Ser77 ковалентно связан с ингибитором. Могу предположить, что такой комплекс не вступает в реакцию дальше, потому что с одной стороны он является аналогом ацил-фермента (если сравнивать с природной реакцией), но имеет при этом отрицательный заряд, что затрудняет атаку на него.

Функциональная роль перечисленных выше остатков подтверждена в литературе.

В CATH домен, соответствующий цепи А структуры 1r50 называется 1r50A00.
Классификация CATH приведена ниже.

CATH.png

  • В белке примерно в одинаковой пропорции есть как альфа-спирали, так и бета-тяжи, поэтому класс присвоен Alpha Beta (CATH не разделяет alpha/beta от alpha + betа);
  • Белок состоит из центрального параллельного бета-листа с примыкающими с двух противоположных сторон альфа-спиралями. Такая архитектура заслуженно называется alpha-beta-alpha sandwich;
  • Можно видеть, что все бета-тяжи параллельны друг другу, также как и все альфа-спирали. При этом направление альфа-спиралей и бета-тяжей противоположное. То есть тяжи и спирали чередуются в последовательности. Учитывая архитектуру, получается топология Rossman fold;
  • По гомологии наша липаза попадает в группу к альфа/бета гидролазам. Наверное, логично, учитывая то, что каталитической триадой много всего можно делать. Например, гидролизовать амиды, сложные эфиры, тиоэфиры.

Задание 2


Во втором задании нужно для нашей липазы найти с помощью PDBeFold два похожих по структуре, но не похожих по последовательности (<35% Identity) и функции белка. Найти отличия, попробовать выделить функциональный мотив.

С рекомендуемыми в практикуме настройками нашлось 2071 хитов. Отсортируем по % Id и перейдем на последнюю страницу.
Я выбрал 6fvj, цепь D (тиоэстераза из Mycobacterium tuberculosis, 9% Id) и 1mvo, цепь А (некий PHOP RECEIVER DOMAIN FROM BACILLUS SUBTILIS, 9% Id).

1r50_thio.png

1r50, зеленая, 6fvj голубая. Выравнено с помощью cealign в pymol.
Как можно видеть, элементы вторичной структуры неплохо сопоставляются. Есть, впрочем, и уникальные для каждого белка.

1r50_PHOP.png

1r50, зеленая, 1mvo желтая. Выравнено с помощью cealign в pymol.
В отличие от явно работающего фермента тиоэстеразы, PHOP RECEIVER DOMAIN звучит как что-то неферментативное. PhoP – транскрипционный фактор некоторых патогенных бактерий, участвующий вместе с мембранным белком PhoQ в рецепции бактерией концентрации внеклеточного магния. Эта рецепция позволяет патогену "понимать", когда бактерия находится внутри клетки хозяина (низкая концентрация магния) и в внеклеточной среде (высокая концентрация магния).
Видно, что центральный бета-лист в PHOP RECEIVER DOMAIN состоит только из трех тяжей. Каких-то отличающихся от 1r50 альфа-спиралей нет.

Посмотрим подробнее на структуры и CATH наших находок.

thioest_lipase.png

Сравнение активных центров тиоэстеразы (голубая) и липазы (белая). Наложено cealign и сдвинуто вручную для лучшего совпадения остатков.
Триада на месте, оксианонный центр на месте, только вместо Ile12 там Ala37, что ничего не меняет, потому что NH смотрит в ту же сторону.
Что касается причины разной субстратной специфичности у двух белков, то можно предположить, что причина в том, что гидролизуемые функциональные группы встречаются не в вакууме, а в контексте остального куска субстрата. Поэтому меняя остальной карман связывания, можно менять и, как следствие, специфичность к той или иной функциональной группе.

В CATH для 6fvj ничего нет, поэтому я нашел (в CATH же, он сам предлагает) наиболее похожую на этот белок по последовательности запись в CATH: 3FLB. E-value около $10^{-26}$. Это тоже тиоэстераза, так что, наверное, все в порядке.

thioester_cath.png

Все совпадает. Логично, учитывая то, что реакция похожая.

phop_lipase.png

Сравнение структуры в районе активного центра липазы А (белая) и участка регуляторного домена PhoP (желтый).
Как можно видеть, похожего тут мало. Если смотреть остатки, то триады нет.

phop_cath.png

В группе гомологий отличие, PhoP reciever domain относится к регуляторным доменам. Разумно, учитывая его функцию.